WEB SEMÂNTICA: EM BUSCA DA WEB INTELIGENTE
Naira Michelle Alves Pereira¹; Gracy Kelli Martins²
¹ Estudante do Curso de Biblioteconomia da Universidade Federal do Ceará – Campus Cariri,
E-mail: nairamichelle_ufc@yahoo.com.br
² Professora do Curso de Biblioteconomia da Universidade Federal do Ceará, Campus Cariri,
E-mail: gracy.martins@cariri.ufc.br
Resumo
A popularização e uso de computadores conectados à Internet permitiu que a Web se tornasse
parte integrante de nossas vidas. A principal causa do grande sucesso da web é a sua liberdade
de publicação de informação e facilidade de manipulação. Essa liberdade e facilidade têm
provocado um crescimento exponencial no número de usuários e quantidade de informações
produzidas e disponíveis, ocasionando assim, problemas de semântica e ambigüidade, por
falta de regras de estrutura, catalogação e indexação dos recursos por seus criadores. Nessa
perspectiva surgiu o projeto Web Semântica, idealizado por Berners-Lee (2001) que propõe
ordenar a confusão informacional existente na web. O presente artigo apresenta uma revisão
de literatura abordando conceitos e estudos sobre a Web Semântica, objetivando incentivar
estudantes de Biblioteconomia à investigação de pesquisas, fomentando as técnicas de
representação da informação, já utilizadas na área da Biblioteconomia, para o
desenvolvimento de tecnologias voltadas ao processo de representações semânticas no
ambiente web. Conclui-se que no atual ambiente web, a partir dos recursos da web 2.0, as
informações não possuem estruturas padronizadas, o que dificulta o processo de recuperação
da informação por máquinas/agentes computacionais. Nessa ótica, percebe-se que, o
profissional bibliotecário com seus conhecimentos de representação da informação pode
contribuir para o desenvolvimento efetivo de linguagens de representação desse perfil
semântico na Web, pois as técnicas de indexação e catalogação utilizadas pela
biblioteconomia poderão contribuir para os estudos relacionados às tecnologias mais
sofisticadas de estruturação e representação semântica das informações na rede.
Palavras-chave: Representação da Informação; Biblioteconomia; Profissional Bibliotecário.
Introdução
A popularização e uso de computadores conectados a Internet permitiu que a Web se
tornasse parte integrante de nossas vidas. A primeira geração da Web foi constituída por
páginas estáticas, confeccionadas à mão e individualmente. Já a sua segunda geração, a Web
2.0, é composta por páginas dinâmicas onde a participação do homem na criação de
conteúdos tem promovido uma maior interatividade. Em conseqüência, o número de usuários
e quantidade de informações disponíveis na rede aumenta a cada dia, produzindo um acúmulo
de informações desorganizadas de maneira exponencial. Diante disso, as ferramentas de busca
nem sempre conseguem filtrar informações relevantes para os usuários, refletindo a
necessidade da padronização dessas informações para uma melhor recuperação.
Nessa perspectiva, surge a Web semântica, que nasce como um possível recurso para
que a informação seja padronizada, compreendida e recuperada, não apenas pelos seres
humanos, mas também pelas máquinas, “na forma de agentes computacionais que são capazes
de operar eficientemente sobre as informações, podendo entender seus significados, ou seja,
incorporar semânticas às informações” (PINHEIRO, 2009, p. 24). Buscou-se analisar, através
da revisão de publicações disponíveis na web, conceitos e informações sobre a Web
Semântica com o propósito de desperta o interesse de estudantes de Biblioteconomia no
desenvolvimento de pesquisas nessa área. Bem como, apontar a importância das técnicas
tradicionais de representação da informação, estabelecidas na Biblioteconomia, como
indexação e catalogação, como base para os processos metodológicos de estruturação,
recuperação e representação semântica dos recursos informacionais existentes na Web,
contribuindo assim para a construção da Web Semântica.
Percebe-se que na Web, as informações não possuem estruturas padronizadas, e por
isso podem ser irregulares, incompletas, parciais e podem mudar com freqüência., causando
uma precariedade em sua estrutura que dificulta o processo de recuperação da informação por
máquinas, ou seja, agentes computacionais. “A busca de soluções para este problema está na
proposta de Berners-Lee,o criador da web, para uma nova geração da web, denominada Web
Semântica” (ROCHA, 2004, p. 117), que foca seus estudos para que as informações possam
ser compreendidas por máquinas, na forma de agentes computacionais capazes de operar
eficientemente sobre as informações incorporando semântica nas relações conceituais
estabelecida por tais informações. (PINHEIRO, 2009).
Materiais e Métodos
Trata-se de uma pesquisa exploratória com abordagem bibliográfica, que tem como
recorte os problemas de organização da informação na web, de forma a facilitar a recuperação
da super-oferta de informação disponível. Este artigo analisou através de um levantamento
bibliográfico: conceitos, informações e tecnologias associadas ao projeto W3 Consortium1
, ou
Web 3.0, mostrando seus objetivos e relevância na otimização dos mecanismos de busca,
recuperação e representação de recursos informacionais. Também foi evidenciada a
importância das técnicas tradicionais da Biblioteconomia na representação da informação, e a
demonstração de forma gráfica das diferenças entre os perfil atual da Web 2.0 e os benefícios
na implantação da Web semântica.
Resultados e discussões
O armazenamento, controle, organização e recuperação da informação na internet são
um dos maiores problemas atuais ocorridos no ambiente web. O enorme volume e diversidade
de informações disponíveis na rede vêm agravando esse quadro devido a falta de estrutura
definida de registros e campos.
Além da falta de estrutura, com o crescimento desordenado da rede, não existe ainda
[...] padrões universais para a organização dos documentos, como os que existem
para bibliotecas e arquivos. A indexação de páginas Web é feita de maneira precária
(através de informações chamadas metatags que são adicionadas ao documento pelo
criador das páginas) ou, na maioria das vezes, elas simplesmente não são indexadas.
São poucos os recursos organizados por profissionais com o conhecimento de
técnicas de indexação e catalogação (CENDÓN, 2007, p. 296).
Diante desses fatos, estudos estão sendo desenvolvidos para inserção de tecnologias
mais sofisticadas nos mecanismos de busca, que possam garantir a recuperação, representação
e estruturação dos recursos na internet, fazendo surgir assim perspectivas para uma próxima
geração da Web, projeto este, denominado Web Semântica.
1
O World Wide Consortium, ou W3C, foi criado em outubro de 1994 para liderar o desenvolvimento da World
Wide Web em relação às suas tecnologias e interoperabilidade. O consórcio conta com várias organizações-
membros, espalhadas por todo o mundo, que buscam oferecer especificações normativas e metodologias para as
tecnologias desenvolvidas na web semântica.
Seu idealizador, Berners-Lee, aponta que “A Web Semântica não é uma Web
separada, mas uma extensão da Web atual na qual as informações apresentam significados
bem definidos e permite que computadores e pessoas possam trabalhar em cooperação”
(BERNERS-LEE, HENDLER, LASSILA, 2001 apud ALVES, 2005, P.27).
Diante desse conceito na tabela 1 destacam-se as diferenças entre a Web 2.0 e a Web
Semântica:
Tabela 1: Diferenças entre a Web 2.0 e a Web Semântica
Web 2.0 Web semântica
Origem Evolução natural da Web Proposta de Berners-Lee para
revolucionar a
Web.
Implantação Muito alta Escassa
Coordenação Não existe W3C
Foco Pessoas Máquinas
Primeiras menções 2003 1999
Expressão Linguagem livre, expressado
mediante folksonomias, palavras-
chave denominadas tags, com
problemas de sinonímia e polissemia.
Linguagem controlada, mediante
linguagem de expressão de ontologias,
sistema de organização do conhecimento
e vocabulários
de metadados.
Algumas
Características
- Descrição de recursos para melhorar
sua distribuição gratuita
- Arquitetura de colaboração
- Usabilidade alta
- Um recurso é mais útil quanto mais
uso tem
- Utilização de uma linguagem
padronizada com sintaxe uniforme e
semântica não
ambígua.
- Interoperabilidade: troca de informação
entre qualquer repositório.
- Usabilidade escassa.
Fonte: Morato, J. et al. (2008 apud CARVALHO, 2009, p. 131).
Para o desenvolvimento da arquitetura informacional da Web 3.0, foram criadas
linguagens como a XML, desenvolvida para realizar a estruturação dos documentos criados
para Web e a RDF, uma linguagem que aplicará significado a essas estruturas, chamada
linguagem de marcação, onde será possível descrever a informação para que o computador
execute a inferência dos significados.
A Web Semântica está dividida em três níveis, ou camadas que são: camada
esquema, responsável por estruturar os dados e definir seu significado para elaboração do
raciocínio lógico; camada ontológica, objetiva definir padrões e relações entre os dados, e
camada lógica, composta por um conjunto de regras de inferência para que os agentes
possam utilizá-las com o objetivo de relacionar e processar informações.
Essas camadas mencionadas são a base para a construção e estabelecimento das
relações semânticas, ou seja, para que as informações apresentem significado bem definidos e
que sejam compreendidas pelas máquinas realizando os processos lógicos por meio de
inferências e possibilidades de recuperação precisa em resposta às buscas humanas.
Tais camadas, a partir das linguagens já mencionadas, estabelecem as relações
semânticas através de agentes computacionais, sendo capazes de operar eficientemente sobre
as informações e estabelecendo interoperabilidade entre sistemas e cooperação entre homem e
máquina. Logo, essa interoperabilidade é a capacidade de compartilhamento de
informações em diversos sistemas, que ocorre por meio de algumas ferramentas como
linguagem de marcação adequada, uso de metadados e arquiteturas de metadados, permitindo
que informações registradas e armazenadas em diferentes estruturas e em diferentes
comunidades do conhecimento possam ser intercambiadas e trocadas nestes sistemas, fazendo
com que haja um trabalho conjunto entre estes. (ALVES, 2005).
Conclusão
O objetivo da Web Semântica é viabilizar a criação de categorias para a representação
dos recursos informacionais existentes e disponíveis no ambiente web. Na Web Semântica, o
profissional bibliotecário com seus conhecimentos de representação da informação pode
contribuir para o seu desenvolvimento, pois as técnicas de indexação e catalogação utilizadas
pela biblioteconomia podem vir a servirem como essência para estudos relacionados ao
desenvolvimento de tecnologias e metodologias para a construção da Web Semântica.
Portanto, pode-se concluir que as metodologias para representação das informações na
Web Semântica é um processo ainda em construção e a Biblioteconomia, está em perfeita
sintonia com os estudos da área da Web Semântica, na medida em que ambos objetivam
aperfeiçoar a recuperação da informação para os usuários. Percebe-se que as atividades
desenvolvidas pelos bibliotecários como catalogar, indexar e classificar, para recuperação,
acesso e disseminação da informação são de fundamental importância para o processo de
estruturação e representação semântica dos recursos informacionais existentes na rede.
Agradecimentos
À Universidade Federal do Ceará pela oportunidade de crescimento intelectual e a
todo o corpo docente do curso de Biblioteconomia do Campus Cariri pelo apoio e estímulo na
reflexão e produção de estudos pertinentes à formação profissional.
Referências
ALVES, Rachel Cristina Vesú. WEB SEMÂNTICA: uma análise focada no uso de metadados.
Dissertação (Mestrado em Ciência da Informação), Universidade Estadual Paulista, Marília, 2005.
BERNERS-LEE, Tim; HENDLER, James ; LASSILA Ora. The Semantic Web: a new form of Web
content that is meaningful to computers will unleash a revolution of new possibilities. Scientific
American, n.5, may 2001.
CARVALHO, Rodrigo Aquino de. Perspectivas na Web Semântica para a Ciência da Informação.
2009. Dissertação (Mestrado em Ciência da Informação), Pontifícia Universidade Católica de
Campinas, PUC-Campinas, Campinas, 2009.
CENDÓN, Beatriz Valadares. A internet. In: CAMPELO, B. S.; CENDÓN, B. V.; KREMER, J. M.
(Org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG,
2007.
PINHEIRO, José Maurício. Web Semântica: rede de conceitos. Cadernos UniFOA, n. 9, p. 23-27,
abr. 2009.
ROCHA, Rafael Port da. Metadados,Web Semântica, Categorização Automática: combinando
esforços humanos e computacionais para a descoberta e uso dos recursos da web. Em Questão, Porto
Alegre, v. 10, n. 1, p. 109-121, jan./jun. 2004.

Web semântica: em busca da web inteligente

  • 1.
    WEB SEMÂNTICA: EMBUSCA DA WEB INTELIGENTE Naira Michelle Alves Pereira¹; Gracy Kelli Martins² ¹ Estudante do Curso de Biblioteconomia da Universidade Federal do Ceará – Campus Cariri, E-mail: nairamichelle_ufc@yahoo.com.br ² Professora do Curso de Biblioteconomia da Universidade Federal do Ceará, Campus Cariri, E-mail: gracy.martins@cariri.ufc.br Resumo A popularização e uso de computadores conectados à Internet permitiu que a Web se tornasse parte integrante de nossas vidas. A principal causa do grande sucesso da web é a sua liberdade de publicação de informação e facilidade de manipulação. Essa liberdade e facilidade têm provocado um crescimento exponencial no número de usuários e quantidade de informações produzidas e disponíveis, ocasionando assim, problemas de semântica e ambigüidade, por falta de regras de estrutura, catalogação e indexação dos recursos por seus criadores. Nessa perspectiva surgiu o projeto Web Semântica, idealizado por Berners-Lee (2001) que propõe ordenar a confusão informacional existente na web. O presente artigo apresenta uma revisão de literatura abordando conceitos e estudos sobre a Web Semântica, objetivando incentivar estudantes de Biblioteconomia à investigação de pesquisas, fomentando as técnicas de representação da informação, já utilizadas na área da Biblioteconomia, para o desenvolvimento de tecnologias voltadas ao processo de representações semânticas no ambiente web. Conclui-se que no atual ambiente web, a partir dos recursos da web 2.0, as informações não possuem estruturas padronizadas, o que dificulta o processo de recuperação da informação por máquinas/agentes computacionais. Nessa ótica, percebe-se que, o profissional bibliotecário com seus conhecimentos de representação da informação pode contribuir para o desenvolvimento efetivo de linguagens de representação desse perfil semântico na Web, pois as técnicas de indexação e catalogação utilizadas pela biblioteconomia poderão contribuir para os estudos relacionados às tecnologias mais sofisticadas de estruturação e representação semântica das informações na rede. Palavras-chave: Representação da Informação; Biblioteconomia; Profissional Bibliotecário. Introdução A popularização e uso de computadores conectados a Internet permitiu que a Web se tornasse parte integrante de nossas vidas. A primeira geração da Web foi constituída por páginas estáticas, confeccionadas à mão e individualmente. Já a sua segunda geração, a Web 2.0, é composta por páginas dinâmicas onde a participação do homem na criação de conteúdos tem promovido uma maior interatividade. Em conseqüência, o número de usuários e quantidade de informações disponíveis na rede aumenta a cada dia, produzindo um acúmulo de informações desorganizadas de maneira exponencial. Diante disso, as ferramentas de busca nem sempre conseguem filtrar informações relevantes para os usuários, refletindo a necessidade da padronização dessas informações para uma melhor recuperação. Nessa perspectiva, surge a Web semântica, que nasce como um possível recurso para que a informação seja padronizada, compreendida e recuperada, não apenas pelos seres humanos, mas também pelas máquinas, “na forma de agentes computacionais que são capazes de operar eficientemente sobre as informações, podendo entender seus significados, ou seja, incorporar semânticas às informações” (PINHEIRO, 2009, p. 24). Buscou-se analisar, através
  • 2.
    da revisão depublicações disponíveis na web, conceitos e informações sobre a Web Semântica com o propósito de desperta o interesse de estudantes de Biblioteconomia no desenvolvimento de pesquisas nessa área. Bem como, apontar a importância das técnicas tradicionais de representação da informação, estabelecidas na Biblioteconomia, como indexação e catalogação, como base para os processos metodológicos de estruturação, recuperação e representação semântica dos recursos informacionais existentes na Web, contribuindo assim para a construção da Web Semântica. Percebe-se que na Web, as informações não possuem estruturas padronizadas, e por isso podem ser irregulares, incompletas, parciais e podem mudar com freqüência., causando uma precariedade em sua estrutura que dificulta o processo de recuperação da informação por máquinas, ou seja, agentes computacionais. “A busca de soluções para este problema está na proposta de Berners-Lee,o criador da web, para uma nova geração da web, denominada Web Semântica” (ROCHA, 2004, p. 117), que foca seus estudos para que as informações possam ser compreendidas por máquinas, na forma de agentes computacionais capazes de operar eficientemente sobre as informações incorporando semântica nas relações conceituais estabelecida por tais informações. (PINHEIRO, 2009). Materiais e Métodos Trata-se de uma pesquisa exploratória com abordagem bibliográfica, que tem como recorte os problemas de organização da informação na web, de forma a facilitar a recuperação da super-oferta de informação disponível. Este artigo analisou através de um levantamento bibliográfico: conceitos, informações e tecnologias associadas ao projeto W3 Consortium1 , ou Web 3.0, mostrando seus objetivos e relevância na otimização dos mecanismos de busca, recuperação e representação de recursos informacionais. Também foi evidenciada a importância das técnicas tradicionais da Biblioteconomia na representação da informação, e a demonstração de forma gráfica das diferenças entre os perfil atual da Web 2.0 e os benefícios na implantação da Web semântica. Resultados e discussões O armazenamento, controle, organização e recuperação da informação na internet são um dos maiores problemas atuais ocorridos no ambiente web. O enorme volume e diversidade de informações disponíveis na rede vêm agravando esse quadro devido a falta de estrutura definida de registros e campos. Além da falta de estrutura, com o crescimento desordenado da rede, não existe ainda [...] padrões universais para a organização dos documentos, como os que existem para bibliotecas e arquivos. A indexação de páginas Web é feita de maneira precária (através de informações chamadas metatags que são adicionadas ao documento pelo criador das páginas) ou, na maioria das vezes, elas simplesmente não são indexadas. São poucos os recursos organizados por profissionais com o conhecimento de técnicas de indexação e catalogação (CENDÓN, 2007, p. 296). Diante desses fatos, estudos estão sendo desenvolvidos para inserção de tecnologias mais sofisticadas nos mecanismos de busca, que possam garantir a recuperação, representação e estruturação dos recursos na internet, fazendo surgir assim perspectivas para uma próxima geração da Web, projeto este, denominado Web Semântica. 1 O World Wide Consortium, ou W3C, foi criado em outubro de 1994 para liderar o desenvolvimento da World Wide Web em relação às suas tecnologias e interoperabilidade. O consórcio conta com várias organizações- membros, espalhadas por todo o mundo, que buscam oferecer especificações normativas e metodologias para as tecnologias desenvolvidas na web semântica.
  • 3.
    Seu idealizador, Berners-Lee,aponta que “A Web Semântica não é uma Web separada, mas uma extensão da Web atual na qual as informações apresentam significados bem definidos e permite que computadores e pessoas possam trabalhar em cooperação” (BERNERS-LEE, HENDLER, LASSILA, 2001 apud ALVES, 2005, P.27). Diante desse conceito na tabela 1 destacam-se as diferenças entre a Web 2.0 e a Web Semântica: Tabela 1: Diferenças entre a Web 2.0 e a Web Semântica Web 2.0 Web semântica Origem Evolução natural da Web Proposta de Berners-Lee para revolucionar a Web. Implantação Muito alta Escassa Coordenação Não existe W3C Foco Pessoas Máquinas Primeiras menções 2003 1999 Expressão Linguagem livre, expressado mediante folksonomias, palavras- chave denominadas tags, com problemas de sinonímia e polissemia. Linguagem controlada, mediante linguagem de expressão de ontologias, sistema de organização do conhecimento e vocabulários de metadados. Algumas Características - Descrição de recursos para melhorar sua distribuição gratuita - Arquitetura de colaboração - Usabilidade alta - Um recurso é mais útil quanto mais uso tem - Utilização de uma linguagem padronizada com sintaxe uniforme e semântica não ambígua. - Interoperabilidade: troca de informação entre qualquer repositório. - Usabilidade escassa. Fonte: Morato, J. et al. (2008 apud CARVALHO, 2009, p. 131). Para o desenvolvimento da arquitetura informacional da Web 3.0, foram criadas linguagens como a XML, desenvolvida para realizar a estruturação dos documentos criados para Web e a RDF, uma linguagem que aplicará significado a essas estruturas, chamada linguagem de marcação, onde será possível descrever a informação para que o computador execute a inferência dos significados. A Web Semântica está dividida em três níveis, ou camadas que são: camada esquema, responsável por estruturar os dados e definir seu significado para elaboração do raciocínio lógico; camada ontológica, objetiva definir padrões e relações entre os dados, e camada lógica, composta por um conjunto de regras de inferência para que os agentes possam utilizá-las com o objetivo de relacionar e processar informações. Essas camadas mencionadas são a base para a construção e estabelecimento das relações semânticas, ou seja, para que as informações apresentem significado bem definidos e que sejam compreendidas pelas máquinas realizando os processos lógicos por meio de inferências e possibilidades de recuperação precisa em resposta às buscas humanas. Tais camadas, a partir das linguagens já mencionadas, estabelecem as relações semânticas através de agentes computacionais, sendo capazes de operar eficientemente sobre as informações e estabelecendo interoperabilidade entre sistemas e cooperação entre homem e máquina. Logo, essa interoperabilidade é a capacidade de compartilhamento de informações em diversos sistemas, que ocorre por meio de algumas ferramentas como linguagem de marcação adequada, uso de metadados e arquiteturas de metadados, permitindo que informações registradas e armazenadas em diferentes estruturas e em diferentes comunidades do conhecimento possam ser intercambiadas e trocadas nestes sistemas, fazendo com que haja um trabalho conjunto entre estes. (ALVES, 2005).
  • 4.
    Conclusão O objetivo daWeb Semântica é viabilizar a criação de categorias para a representação dos recursos informacionais existentes e disponíveis no ambiente web. Na Web Semântica, o profissional bibliotecário com seus conhecimentos de representação da informação pode contribuir para o seu desenvolvimento, pois as técnicas de indexação e catalogação utilizadas pela biblioteconomia podem vir a servirem como essência para estudos relacionados ao desenvolvimento de tecnologias e metodologias para a construção da Web Semântica. Portanto, pode-se concluir que as metodologias para representação das informações na Web Semântica é um processo ainda em construção e a Biblioteconomia, está em perfeita sintonia com os estudos da área da Web Semântica, na medida em que ambos objetivam aperfeiçoar a recuperação da informação para os usuários. Percebe-se que as atividades desenvolvidas pelos bibliotecários como catalogar, indexar e classificar, para recuperação, acesso e disseminação da informação são de fundamental importância para o processo de estruturação e representação semântica dos recursos informacionais existentes na rede. Agradecimentos À Universidade Federal do Ceará pela oportunidade de crescimento intelectual e a todo o corpo docente do curso de Biblioteconomia do Campus Cariri pelo apoio e estímulo na reflexão e produção de estudos pertinentes à formação profissional. Referências ALVES, Rachel Cristina Vesú. WEB SEMÂNTICA: uma análise focada no uso de metadados. Dissertação (Mestrado em Ciência da Informação), Universidade Estadual Paulista, Marília, 2005. BERNERS-LEE, Tim; HENDLER, James ; LASSILA Ora. The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, n.5, may 2001. CARVALHO, Rodrigo Aquino de. Perspectivas na Web Semântica para a Ciência da Informação. 2009. Dissertação (Mestrado em Ciência da Informação), Pontifícia Universidade Católica de Campinas, PUC-Campinas, Campinas, 2009. CENDÓN, Beatriz Valadares. A internet. In: CAMPELO, B. S.; CENDÓN, B. V.; KREMER, J. M. (Org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG, 2007. PINHEIRO, José Maurício. Web Semântica: rede de conceitos. Cadernos UniFOA, n. 9, p. 23-27, abr. 2009. ROCHA, Rafael Port da. Metadados,Web Semântica, Categorização Automática: combinando esforços humanos e computacionais para a descoberta e uso dos recursos da web. Em Questão, Porto Alegre, v. 10, n. 1, p. 109-121, jan./jun. 2004.